作者：Alfie Kohn

唯有非凡的教育才关注学习本身；多数教育只关注分数：而对年轻人而言，二者几乎完全相反。

— Marilyn French

I. 常识告诉我们，我们应该先明确教育目标，再定期检视实现目标的成效。因此，评估的角色本应是教与学过程中谦恭的助手。不幸的是，今天的教育界的常识短缺，因为评估已经主导了整个教育过程。更糟糕的是，如今最常见的评估形式的目的和设计——无论课堂内外——常常导致灾难性的后果。

一部分问题在于我们回避真正该问的问题，不愿顺着数据的脉络深入探究。相反，我们只在细枝末节上做文章，微调教育评估技术，却对更大的问题视而不见。以打分为例，当前的讨论多半集中在多久公布一次成绩，或某个成绩等级的门槛划在哪里（比如什么样的表现算 B）。一些教育者开始过度关注得 A 的学生是否太多。

然而，从另一个角度来看，真正的问题并不是分数通胀——而是分数本身，因为它从根本上破坏了学习的意义。真正令人愤慨的不是太多学生得 A，而是太多学生被灌输了一种观念：上学的目的就是为了得 A。具体来说，研究表明，传统的字母或数字评分制度往往会导致三个后果。

第一，学生会逐渐对学习内容失去兴趣。他们考取好成绩的动机越强烈，探索思想的动力就越弱。第二，学生会尽可能回避具有挑战性的任务。在他们看来，难度更大的作业无疑会阻碍获得高分。第三，学生思维的质量令人堪忧。大量研究表明，传统的打分方式会削弱学生的创造力，甚至损害他们对知识的长期记忆。

这些结论所依据的数据，只要用心就能找到。至于废除分数制度面临的实际困难——包括如何让家长理解此举对孩子的益处——对于任何决心完成这项改革的人来说都是可以解决的。然而，在行动之前，我们必须认真反思一个根本问题：评估学生的初衷究竟是什么？

如果我们的根本目的是收集能够提高学习质量的信息，那么传统的成绩单显然不如更加仿真的模型。不幸的是，评估有时会受到完全不同目标的驱动——例如，激励学生（把分数当作胡萝卜和大棒来强迫他们更加努力）或对学生进行排名（目的不是帮助每个人学习，而是区分谁比谁更优秀）。无论是哪种情况，这样的评估项目从一开始就注定要失败，原因并不在于我们尚未找到正确的评估方法，而在于我们的评估目标本身就存在根本性的错误。

学校不仅通过考试成绩（最令人不齿的例子就是按照某种分布打分），还借助标准化考试对学生进行分类。所谓的常模参照测试，如爱荷华州基本技能综合测试，其目的并非评估教学效果和学习质量，而是通过人为拉开学生分数差距来实现排名。这类考试不仅采用相对指标呈现结果（而不是根据固定标准评估每个人做得如何），而且试题的选择也是为了排名。如果大部分学生都能答对某道题，出题者很可能会将其剔除，至于学生是否应该掌握这一知识点并不重要。因此，正如评估专家 W. James Popham 所言，用 ITBS 这样的测试衡量教育质量，无异于「用汤匙测量温度」。

标准化测试还存在其他弊端：（a）考试内容往往脱离课堂实际，由远离学校的机构命题和评分，（b）题型以选择题为主（因此学生无法自主作答或解释思路），（c）有时间限制（因此更重视思考速度而非思考质量），以及（d）一考定终身，给学生带来巨大压力。

这些特征无一例外都与真正有意义的评估背道而驰。恰恰相反，它们对教学产生了极为强大而深远的负面影响。教师们感到越来越大的压力，不得不从真正的学习时间中分出宝贵的时间，去准备学生应付这些糟糕的考试。当然，这些压力有些源自州政府的要求。然而，层层加码的学区管理者常常会火上浇油，增加更多的测试，而这些测试有时恰恰是参考价值最低的（因为它们都是根据常模而非学习目标来设计的），也是破坏性最大的（因为教师最终不得不设计出一种低智化的、应试型的课程）。当然，这一切都打着提高标准和加强问责的幌子，但正如任何优秀教师都会告诉你的，其实际结果就是将智力活动挤出课堂。

事实上，研究人员也能证实这一点。在科罗拉多州开展的一项研究中，一些四年级教师被要求教授同一项任务。大约一半的教师被告知，在他们完成教学后，他们的学生必须「达到标准」，在测试中取得好成绩。另一组教师，被分配了相同的任务，只是被要求「帮助孩子们学习」。最后，所有学生都参加了测试。结果显示：相比之下，在过分强调达标的班级里，学生掌握这项任务的程度并不理想。

为什么会出现这种情况？一方面，当教师感受到取得成绩的压力时，他们往往也会反过来给学生施加压力。这正是在纽约开展的一项后续研究所发现的情况。教师的控制欲增强，几乎剥夺了学生自主学习的任何机会。由于人们在感到被控制时很少能发挥出最佳水平，科罗拉多实验的发现就不出乎意料了：教师越是关注测试结果和「提高标准」，学生的实际表现反而越差——更不用说他们的学习热情可能会逐渐消退。

II. 如果认真对待上述这些关于分数和测试的担忧，其影响显然将是巨大的。然而，即使这样的批评也没有触及当前评估方法的根本问题。深层的问题涉及一个基本区别，而这个区别在过去二十年里一直是教育心理学领域一些工作的核心。这就是关注你做得有多好与关注你正在做什么之间的区别。

认真考虑这样的一所学校，它不断强调表现、结果、成绩和成功！一个已经接受了这种观念的学生，可能会发现自己很难全身心投入创作诗歌，或尝试制作能用的望远镜。他可能过于关注结果，以至于无法真正投入到产生这些结果的活动中去。当然，关注结果和专注过程这两种取向并不矛盾，但在实践中，它们给人的感受是不同的，导致截然不同的行为方式。即使我们不知道一个学生在某项任务上的实际表现如何，或者她应该有多聪明，仅仅知道她是被引导更关注学习的层次还是成绩的高低，我们就可以对她有很多了解。

难道学生的学习效率不重要吗？当然很重要。我们有必要定期与学生一起总结讨论，评估他们（和我们）的教学成效如何。但如果过度关注结果，反而会适得其反，得到并不理想的结果。有证据表明，过度痴迷标准和成绩很可能导致五个令人不安的后果：

1. 学生开始将学习视为一项苦差事。 当学生不断被要求关注自身的学习成绩时，他们对学习的态度首先受到影响。他们可能会开始将任务本身——故事、科学项目和数学问题——视为必须完成的任务，是应该用于拿到更高分数的材料，而不是他们兴致盎然、热衷探索的材料。一心只想成为顶尖学生的人或许会坚持学习，但一旦考试成绩成了主要目的，他们对学习内容本身的兴趣和探索知识的热情往往就会消退。

这一现象与心理学家的一个发现有关：个人的内在动机和外在动机往往是负相关的。人们为了获得奖励去做某事的频率越高，就越有可能对这件事本身失去兴趣。因此，当学生被告知要为了应付考试而了解某些内容——或者更广泛地说，他们即将做的事情将计入成绩——他们可能会感觉这项任务（或书籍、想法）本身变得乏味无趣，这并不令人惊讶。

**2. 学生试图避免有挑战性的任务。**如果学习的重点是追求成功而非拓展思维、探索新知，那么学生偏好选择最容易的任务是完全合乎逻辑的。毕竟，这将最大化成功的概率——或者至少最小化失败的概率。

许多研究人员已经验证了这个假设。在典型的实验中，孩子们被告知他们将要接受一项任务。其中一些孩子被告知他们的表现将受到评估，而另一些孩子则被鼓励将此视为学习的机会，而非追求好成绩。然后，每个学生可以选择他们想要尝试的任务难度。结果总是一致的：那些被告知这是「一个学习机会」的孩子，比那些被引导去想自己的表现将会如何的孩子更愿意挑战自己。

我们可以方便地假设那些走捷径的孩子只是出自懒惰，因为这样的话问题就出在孩子身上，似乎只需要修正孩子即可。但也许他们只是太过理性，已经适应了一个注重结果而非鼓励探索的环境。当学校系统使用传统的评分系统——或者更糟糕的是，当他们增加荣誉榜和其他激励措施来增强成绩的重要性——它们无意中打击了学生挖掘自身潜力的积极性。讽刺的是，学校管理者和改革者们苦苦抱怨现在的孩子们只想走捷径，但他们自己却营造了一种过度注重成绩和结果的氛围，这必然会导致他们所抱怨的结果。

**3. 学生往往缺乏深入思考。**一些学生的目标是学习新技能，探索世界，理解他们在做什么。当他们拿起一本书时，他们思考的是他们在读什么，而不是他们读得有多好。看似矛盾，但那些将成功置之度外的学生反而更容易取得成功。他们能够更深入地加工信息，反复审视自己没弄懂的地方，将当下所学与他们早先学到的知识联系起来，并运用多种策略去领会新接触到的想法。诸多实证研究都证实了这一点。

相比之下，那些在引导下一心只想得出正确答案或考高分的学生，思考往往流于表面。这里我们可以注意一下关于这个问题的数十项研究之一，它考察了知识迁移的能力——也就是说，将学到的东西运用到新任务或问题中去。在研究中，在一组八年级学生即将开始为期一周的科学课单元之前，研究者评估了每个学生是注重理解还是追求成功。单元结束时的知识迁移能力测试显示，不管之前的考试成绩如何，注重成功的学生的表现都不如注重理解的学生。

**4. 学生面对失败时可能会一蹶不振。**任谁都难免偶尔失误，而从错误中汲取教训、逐步改进，正是高效学习的关键。因此，培养学生积极应对挫折、从失败中迅速恢复的良好心态和应变能力至关重要。通常来说，将学习本身视为目标的学生往往能做到这一点：他们把失误看作宝贵的经验，冷静分析问题所在，并想方设法加以解决。

然而，对于那些相信（通常是因为他们被明确告知）重点是获得优异成绩——甚至是超越他人的孩子来说，情况则大不相同。他们在一帆风顺时似乎游刃有余，但一旦遇到挫折便会心理失衡，仿佛丧失了信心和斗志。在他们眼中，哪怕是偶尔的失误，也足以抹杀此前取得的所有成绩。当学习的重点不在于探索未知、而在于证明自己有多优秀时，任何不尽如人意的表现都可能令他们无法接受。

想想那些考了 92 分而非平时的 100 就焦虑万分的学生吧。我们往往将此归咎于他们个人，认为是他们太过严苛，给自己施加了过大的压力。但是，「我正在做什么」与「我做得有多好」之间的区别可以为我们提供一个新的视角，来理解这里发生的事情。学生在面对挫折（哪怕只是相对的挫折）时信心尽失，根本原因很可能在于对高分数、好成绩的系统性要求。

关键点不在于多少分才算不及格（如 92 分与 40 分之间的差距）。真正重要的是学生感受到的不许失败的压力，这种压力对优秀和有天赋的学生影响尤其有害。因此，安慰学生「92 分已经很高」或「相信你下次会表现得更好」不仅没有抓住问题的本质，反而加剧了问题的严重性——因为这再次凸显出学校教育的重点不是鼓励探索思想，而是力争成为第一。

**5. 学生们更重视能力而非努力。**当一名学生在测验中得到满分时，我们通常会作何反应？大多数老师和家长会视之为值得庆祝的好消息。然而，那些想的更多的人却未必会感到高兴。首先，他们会担心教学采用了「填鸭」方法，以及使用传统测验所反映出的评估方法。即便是成绩优异的学生，这样的教学也无法真正让他们受益。

然而，即便采用了更加完善的评估方式，有洞察力的观察者仍会意识到，相较于分数本身，学生对自己为何取得该分数的看法可能更为重要。不妨让我们来探究一下，一名学生可能会如何解释自己在考试中的优异表现。第一种可能是努力：她全力以赴，埋头苦读，竭尽所能地掌握知识。第二种可能是能力：如果你问她如何得到满分，她可能会回答（或暗想）：「啊，大概是因为我够聪明吧。」还有一种答案是运气：她觉得自己猜对了答案或者状态正佳。最后，她可能将结果归因于题目难度——在本例中，考试较为简单。（值得注意的是，同样这四个理由也可以被另一个在同一测验中只得 23 分的学生用来解释：我没有尽力；我太笨了；运气不济；或者考题太难。）

在以上四种对表现出色（或糟糕）的解释中，你更倾向于哪一种？你希望学生用哪种理由来诠释自己在校的表现？几乎所有人都会选择努力。孩子们将好成绩归功于考前的刻苦准备，这对他们的未来无疑是一个好兆头。同样，那些将低分归咎于考前准备不足的学生，往往也会意识到失败是可以在下一次避免的。由此可见问题的关键所在：当学生在引导下关注自身在校的表现时，他们通常倾向于用自己的聪明才智，而非付出的努力来解释成绩。

研究表明，对于这些问题——我做得怎么样？我的成绩够高吗？我的答案正确吗？——关注表现的学生倾向于从自身能力的角度来解答。教育心理学家Carol Dweck及其同事曾对学习成绩优异的学生进行研究，结果发现，老师越是强调考高分、不出错、跟上他人进度，学生遇到挫折时就越容易将原因归咎于能力不足等他们认为超出自己控制的因素。当学生不断地被引导思考他们的表现如何时，他们往往会从自身能力寻找原因，而不是反思自己是否付出了足够的努力。

研究还发现，相比那些将成绩归因于努力的学生，认为成绩取决于智力的青少年在学习时思考得更浅、更马虎。同样，将失败归因于能力不足的小学生阅读能力也普遍较差。此外，习惯于被称赞「聪明」的孩子一旦遇到学习挫折，成绩会明显下滑，而这种情况在其他孩子身上则不会发生。

综上所述，人们对智力以及成功与失败原因的信念至关重要。其影响往往超过学生的自信程度、实际能力或上周考试的成绩。如果我们像那些「更严格标准」的提倡者一样，只盯着及格线，只关注考试成绩和分数，我们最终会忽视学生对结果的理解方式。如果我们让孩子过度思考如何提高成绩，到头来他们可能会以最不具建设性的方式来看待考试结果。

如果这番话听起来或许有些激进，那是因为它确实如此——激进一词源自拉丁语，本意是指「根本的」。确实，前沿研究确实提出了一些根本性的问题，包括测试本身的弊端可能并不局限于内容。真正的危害在于过度关注考试结果。即使是最公正、精心设计、「真实反映」学生知识水平的评估，如果过分强调学生的表现，从心理学的角度来看，同样值得担忧，这会导致学生（和他们的老师）更关注考试结果而忽视学习过程本身。正如密歇根大学的 Martin Maehr 和 Carol Midgley 所总结道：「过分强调评估实际上会削弱人们对卓越的追求。」无论评估质量如何，这一点都适用。而劣质的测试只会加剧这种危害。

在学生求学的大部分时间里，尤其是低年级学生，当然也包括高年级学生，他们都应该能够自由地思考、写作和探索，而无需顾虑自己的水平高低。只有偶尔，老师才需要引导他们关注自己取得了怎样的学习进展，以及如何才能进一步提升。在这种情况下，评估学生的学习状况完全可以，而且应该在不借助传统分数和标准化考试的情况下进行。但大多数时候，学生应该沉浸在学习中。

如果您希望更加深入地探讨专注于表现（成绩）和学习过程之间的差异，以及相关的研究参考文献，请阅读 The Schools Our Children Deserve 一书的第二章。

Thoughts Memo 翻译合集

过度强调成绩的代价

《学校管理员》1999 年 11 月刊